检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 面向维汉神经机器翻译的双向重排序模型分析

张新路, 李晓, 杨雅婷, 王磊, 董瑞

北京大学学报自然科学版 2020, 56 (1): 31-38. DOI: 10.13209/j.0479-8023.2019.093

摘要（1291）

HTML

PDF（pc）（899KB）（188）

在维吾尔语到汉语等低资源语料库上, 神经机器翻译的拟合训练容易陷入局部最优解, 导致单一模型的翻译结果可能不是全局最优解。针对此问题, 通过集成策略, 有效整合多个模型预测的概率分布, 将多个翻译模型作为一个整体; 同时采用基于交叉熵的重排序方法, 将具有相反解码方向的翻译模型相结合, 最终选出综合得分最高的候选翻译作为输出。在CWMT2015维汉平行语料上的实验结果表明, 与单一的Transformer模型相比, 改进后的方法提升4.82个BLEU值。

相关文章 | 多维度评价 | 评论（0）

Select

2. 字符级的维吾尔语形态协同分析方法

吐尔洪·吾司曼, 杨雅婷, 艾孜孜·吐尔逊, 程力

北京大学学报自然科学版 2019, 55 (1): 47-54. DOI: 10.13209/j.0479-8023.2018.067

摘要（954）

HTML

PDF（pc）（1060KB）（228）

针对维吾尔语中构形词缀种类多、构形复杂以及发生音变现象等问题, 提出一种基于字符级的维吾尔语形态协同分析方法。该方法最大的特点是同时进行维吾尔语的形态切分、形态标注以及音变还原, 将词素边界、形态标记以及音变信息用一个复合标记描述, 采用字符序列的标注方法进行训练。实验结果显示, 形态切分、形态标注及音变还原的正确率分别达到96.39%, 92.78%和99.79%, 系统总体正确率达92.59%。

相关文章 | 多维度评价 | 评论（0）